llm

2025 年开源 LLM 基准:速度与任务性能

当今AI领域,开源大型语言模型(LLM)的选择日益丰富,但如何权衡生成速度与任务性能,成为摆在开发者和项目负责人面前的核心难题。一项对40余款0.5B至235B参数量模型的最新基准测试,揭示了“越大越好”或“越快越好”并非放之四海而皆准的答案。本文将深入剖析这

编程 推理 开源 llm llm基准 2025-06-11 18:31  9

「Next-Token」范式改变!刚刚,强化学习预训练来了

在 2016 年的一次演讲中,Yann LeCun 曾将强化学习比喻成蛋糕上的樱桃。他提到,「如果把智能比作一块蛋糕,那么无监督学习就是蛋糕的主体,监督学习就是蛋糕上的糖霜,而强化学习则是糖霜上的樱桃。我们已经知道如何制作糖霜和樱桃,但却不知道如何制作蛋糕本身

训练 范式 llm token rpt 2025-06-11 12:39  10

验证码背后的秘密:它究竟在验证什么?

无论是在注册新账户、发表评论,还是进行在线支付,我们都常常会遇到一个特殊的“关卡”——验证码。这些扭曲的字符、模糊的图片,或是需要我们完成特定操作的任务,似乎成了现代网络生活中一个不可或缺的组成部分。它们的存在感如此之强,以至于我们很少停下来思考:这个小小的机

llm api 字符 验证码 recaptcha 2025-06-10 22:08  9

非法本、双学位到底能不能考NY Bar?这一篇全知道

对于非法本学生而言,能否通过美国律师资格考试,是留学和职业规划中的重要问题。作为华人考生最热门的两大考场之一,纽约州(NY Bar)以其严格的学分审核机制成为非法本学生的核心挑战。本文将深入拆解NY Bar报考资格,包括学分计算、申诉策略等,帮助你更好地扫清障

llm ny aba 双学位 nybar 2025-06-09 16:27  11

MIPT团队:AmbiK如何解决厨房任务歧义?

在人工智能和机器人领域,让机器理解人类的自然语言指令一直是一个巨大挑战。想象一下,你对家里的厨房机器人说:"帮我把蛋糕放在盘子上。"如果厨房里有多个盘子,机器人应该如何选择?它应该主动询问你想用哪个盘子,还是自己做决定?这种情况就是我们所说的"指令歧义"问题。

llm 厨房 ambik mipt mipt团队 2025-06-09 15:25  14

光芯片,即将起飞!

大型语言模型(LLMs)正在迅速逼近当代计算硬件的极限。例如,据估算,训练GPT-3大约消耗了1300兆瓦时(MWh)的电力,预测显示未来模型可能需要城市级(吉瓦级)的电力预算。这种需求促使人们探索超越传统冯·诺依曼架构的计算范式。

芯片 石墨烯 llm vcsel 忆阻器 2025-06-09 09:35  11

多模态大模型行业近期交流(附大模型概念股)

当前常见场景分双模态(如语音加文字、语音加情感、无声音视频配手语等和三模态。在技术结构上,多态和单模态从训练和推理两角度有本质区别。训练角度,单模态如语音识别基于强化学习无标注可行,但多模态涉及两个及以上模态时绕不过数据标注,成本和周期会长一些,且要解决向量统

模型 模态 llm 文生 概念股 2025-06-09 00:03  13